文章目录
  1. 1. 构造函数
  2. 2. add,contains方法
  3. 3. 总结

HashSet在针对单个项的增删改几乎具有O(1)的性能,也常常被用于快速查找需要下的集合存储,相信各位这些特性很容易联想到HashMap,那么各位了解这两者的区别和联系不?

看了源代码估计大家会大吃一惊,这,这HashSet不就是HashMap的简化无value版本嘛?对,HashSet就是基于HashMap实现的(通过组合的方式),并且几乎所有方法都是调用了HashMapapi,最大的区别是将HashMapvalue直接用new Object()对象来替换了。所以你可以这么认为:

HashSet<T> hashSet=new HashMap<T,Object>()

构造函数

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
static final long serialVersionUID = -5024744406713321676L;

private transient HashMap<E,Object> map;//这就是存储HashSet的实体

// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();

/**
* Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
* default initial capacity (16) and load factor (0.75).
*/

public HashSet() {
map = new HashMap<>();
}

/**
* Constructs a new set containing the elements in the specified
* collection. The <tt>HashMap</tt> is created with default load factor
* (0.75) and an initial capacity sufficient to contain the elements in
* the specified collection.
*
* @param c the collection whose elements are to be placed into this set
* @throws NullPointerException if the specified collection is null
*/

public HashSet(Collection<? extends E> c) {
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
}

/**
* Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
* the specified initial capacity and the specified load factor.
*
* @param initialCapacity the initial capacity of the hash map
* @param loadFactor the load factor of the hash map
* @throws IllegalArgumentException if the initial capacity is less
* than zero, or if the load factor is nonpositive
*/

public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}

/**
* Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
* the specified initial capacity and default load factor (0.75).
*
* @param initialCapacity the initial capacity of the hash table
* @throws IllegalArgumentException if the initial capacity is less
* than zero
*/

public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}

从源码中可以发现HashSet是使用HashMap来存储的,并且在各个构造函数中均是直接初始化HashMap

add,contains方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
/**
* Returns <tt>true</tt> if this set contains the specified element.
* More formally, returns <tt>true</tt> if and only if this set
* contains an element <tt>e</tt> such that
* <tt>(o==null&nbsp;?&nbsp;e==null&nbsp;:&nbsp;o.equals(e))</tt>.
*
* @param o element whose presence in this set is to be tested
* @return <tt>true</tt> if this set contains the specified element
*/

public boolean contains(Object o) {
return map.containsKey(o);
}

/**
* Adds the specified element to this set if it is not already present.
* More formally, adds the specified element <tt>e</tt> to this set if
* this set contains no element <tt>e2</tt> such that
* <tt>(e==null&nbsp;?&nbsp;e2==null&nbsp;:&nbsp;e.equals(e2))</tt>.
* If this set already contains the element, the call leaves the set
* unchanged and returns <tt>false</tt>.
*
* @param e element to be added to this set
* @return <tt>true</tt> if this set did not already contain the specified
* element
*/

public boolean add(E e) {
return map.put(e, PRESENT)==null;
}

HashSet两个最常用方法的源码中也可以看到,contains方法其实就是调用了containsKey,复杂度为O(1),而add方法在插入值的时候是使用了put(e,PRESENT)来操作,这个PRESENT其实是一个Object的常量。

其余方法也不再多看,基本和上面的一个套路。

总结

为什么HashSet在实现上是完全用了HashMapapi的,一个Key-Value型,一个Key型,除了这种转换有没有其他可以更加高效的方法呢?
(下面只是LZ想想的,个人想法而已)
HashMap使用了链表+数组的方式实现了Key-Value的存储,其增删改的性能已经几乎接近了O(1),而HashSet的出现时为了存储Key型的数据,被Key-Value包含在内,完全可以使用HashMap来实现,至于这里使用常量Object来替换里面的value,我们都知道常量Object都是存储在方法区中,并且这里只有一份副本,HashSet存在多个项并不会增加方法区中的存储,所以关于Object的替换产生的开销很好,并且HashMap在原理已经很好了,没必要再去重复造轮子,所以个人觉得HashSet在实现上用了HashMap的封装还是比较合理的。

那么既然HashSet是基于HashMap先实现的,那么它也应该有如下几大特征:

  • 多线程不安全
  • 项的增删改查的复杂度几乎为O(1),所以也常被用于集合元素的查找
  • 支持null的值
  • loadFactor越大,hash冲突的概率越大,table的利用率越大,反之都越小

本作品采用[知识共享署名-非商业性使用-相同方式共享 2.5]中国大陆许可协议进行许可,我的博客欢迎复制共享,但在同时,希望保留我的署名权kubiCode,并且,不得用于商业用途。如您有任何疑问或者授权方面的协商,请给我留言

文章目录
  1. 1. 构造函数
  2. 2. add,contains方法
  3. 3. 总结